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fi 要 : [目的 /意义 ] 作者 自 引 是 学 本 界 常见 的 现象 ,是 引文 分 析 和 科学 评价 中 考虑 的 重要 因素 ,但 如 何在 科学 评价 中 处 
理 自 引 一 直 存 在 争议 。 探 索 作 者 自 引 规律 能 够 为 适当 处 理 作者 自 引 提供 建议 。|[ 方法 /过程 ] 首 先 对 作者 自 引 相 
关 的 研究 成 果 作 了 梳理 ,然后 使 用 中 国 图 书 情报 学 领域 期 刊 的 数据 ,以 及 回归 分 析 等 统计 学 方法 在 作者 和 文献 层 


次 对 作者 自 引 情 况 进行 分 析 。[ 


结果 /结论 ] 实证 研究 表明 ,中 国 图 书 情报 学 领域 的 作者 自 引 行为 总 体 上 较 少 , 作 


者 自 引 频 次 与 其 发 表 文 献 数量 有 强 正 相关 性 ,作者 自 引 对 指数 的 影响 比较 小 ,文献 自 被 引 对 其 被 他 引 频 次 有 正 


向 影响 等 。 
词 : 作者 自 引 引文 分 析 图 书 情报 学 科学 评价 
: G253.1 


本 自 引 , 是 学 术 界 一 种 常见 的 引文 现象 。 对 作者 .其 
砂 机 构 、 国 家 等 不 同 的 主体 来 说 , 自 引 的 定义 有 所 不 
后 D”。 其 中, 期刊 自 引 \ 作 者 自 引 两 种 自 引 现象 一 般 


致 其 期 刊 影响 因子 和 排名 有 所 失真 ”。 因 此 ,一 些 学 
者 认为 不 当 自 引 行为 已 极 大 地 影响 了 科学 评价 ”。 然 
而 ,也 有 一 些 学 者 为 自 引 “正名 ” ,认为 自 引 大 多 属于 
正常 引用 行为 5 。M. Schreiber 归纳 了 自 引 产生 的 3 
个 原因 :中 研究 需要 使 用 先前 的 实验 设置 、 理 论 模 型 、 


感 计 引 分 析 的 重心 。 引 文 分 析 是 文献 计量 学 研究 的 重 
要 秀 法 , 自 引 分 析 是 引文 分 析 的 重要 组 成 部 分 。 自 引 
A 定 程度 上 揭示 主体 引用 的 意图 、 主 体 研 
究 芍 连续 性 等 ,因此 自 引 研究 对 于 文献 计量 学 以 及 科 
学 评价 来 说 至 关 重 要 。 目 前 ,科学 评价 中 常用 的 传统 
KIR, Ut HU me BE h 指数 等 指标 以 被 引 次 数 作为 
基础 ,而 在 使 用 被 引 数 这 一 指标 时 ,多 数 情况 下 是 将 自 
引 计算 在 内 的 ,并 不 区 分 自 引 和 他 引 , 因 此 主体 有 可 能 
通过 操纵 自 引 来 提高 其 科学 评价 。 此 外 ,为 了 使 科学 
评价 更 加 客观 有 效 ,作为 科学 评价 数据 库 之 一 的 期 刊 
引证 报告 (Journal Citation Report, JCR ) 开始 提供 一 种 
不 含 自 引 的 科学 评价 指标 , 即 他 引 影 响 因子 。 

自 引 在 学 术 界 是 一 个 饱 受 争议 的 话题 。 有 时 ,其 
刊 的 自 引 已 成 为 其 追求 高 被 引 和 高 影响 因子 的 操纵 手 
段 之 一 。JCR 每 年 都 会 发 布 “ 镇 压 "的 期 刊 名 单 , 不 再 
为 这 些 期 刊 提供 索引 服务 。2021 年 ICR 发 布 10 种 被 
镇 压 的 期 刊 ,主要 原因 是 过 度 自 引 等 异常 引用 行为 导 


结果 和 结论 ,但 为 了 避免 重复 叙述 进行 了 自 引 ,这 种 自 
引 是 合理 的 ;@ 由 于 每 个 人 都 最 了 解 自己 先前 的 论文 ， 
因此 在 后 续 研 究 时 引用 自己 先前 的 论文 相对 容易 ,这 
种 自 引 有 一 定 争议 ;名 自 引 是 为 了 提高 个 人 的 被 引 频 
Kh 指数 等 ,这 种 自 引 属于 无 可 争议 的 不 当 自 引 ” 。 

E. Garfield 认为 自 引 本 无 所 谓 好 坏 ” ,关键 在 于 如 
何 看 待 和 利用 它 。 当 前 状况 下 ,寻找 能 够 区 分 过 度 自 
引 和 适度 自 引 的 方式 ,探索 在 科学 评价 中 适当 地 处 理 
自 引 的 方法 ,是 解决 自 引 争议 问题 的 方向 所 在 。 本 文 
将 从 以 下 两 个 方面 展开 分 析 : 中 总 结 归 纳 与 自 引 相关 
的 重要 研究 ;@ 以 我 国 图 书 情报 学 领域 中 文 文献 数据 
为 例 ,以 作者 自 引 为 研究 对 象 ,分 析 与 作者 自 引 的 相关 
指标 具有 相关 性 的 文献 计量 学 因素 并 探讨 中 文 图 书 情 
报 学 领域 作者 自 引 对 科学 评价 的 影响 程度 。 


2 ”研究 现状 
自 引 在 学 术 界 是 普遍 的 。E. Garfield 指出 , 仅 以 第 
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一 作者 计算 , 自 引 在 全 部 引文 中 所 占 比例 约 为 109% , 
若 全 部 合 著者 都 计算 在 内 该 比例 会 更 大 所 Aint, A 
引 对 科学 评价 也 有 重要 的 影响 ,因此 如 何 处 理 自 引 是 
科学 评价 中 亟待 解决 的 问题 。 
2.1 自 引 测量 指标 的 定义 

在 自 引 相关 研究 中 ,“ 自 引 率 ” 这 一 定义 的 使 用 存 
在 混淆 ”。 更 准确 的 做 法 是 针对 于 “ 自 引 证 率 ” 和 “ 自 
被 引 率 " 作 区 分 。E. Garfield 在 1975 年 发 布 的 JCR 前 
APEA: 期 刊 的 自 引 率 (self-citation rate) 有 两 个 ,一 
个 是 自 引证 率 (self-citing rate) , 即 自 引 引文 在 全 部 参 
考 文献 中 的 比例 , 另 一 个 是 自 被 引 率 ( self-cited rate) , 
即 自 引 引文 在 全 部 被 引 频 次 中 的 比例 “!。 自 引证 率 
属于 自 引 的 共 时 性 指标 ,而 自 被 引 率 则 是 历时 性 指标 。 
从 词义 上 讲 , 自 引 证 率 和 自 被 引 率 的 计算 公式 如 下 : 


、 。_ 某 主体 引证 自身 的 数量 l 
RUNEM = “ 菜 主 体 引证 总 数 SY) 


= 某 主 体 被 引 总 数 
本 过 去 的 研究 中 ,对 于 作者 自 引 , 学 界 没有 一 个 统 
规范 的 定义 。 由 于 一 篇 文献 可 能 由 多 个 作者 所 著 ， 
并 闻 作 者 有 署名 顺序 的 差异 ,因此 对 于 作者 自 引 可 能 
册 观 多 种 定义 。 目 前 ,多 数 研究 将 作者 自 引 定义 为 一 
位 性 者 引用 了 他 自身 发 表 的 文献 。 这 也 是 本 文 所 采用 


的 定义 ,在 此 定义 下 作者 自 引证 率 和 自 被 引 率 计算 公 


= pox _ 作者 引证 自己 文献 的 数量 
C FERIE 作者 引证 总 数 
= AK (3) 


，，，,。。_ 作 者 被 自身 引用 的 数量 
作者 自 被 引 率 = 作者 被 引 总 数 


公式 (4) 
值得 注意 的 是 ,本 文 使 用 的 作者 自 引 的 定义 是 考 
虑 全 作者 的 作者 自 引 , 并 不 要 求 自 引 作 者 是 否 为 施 引 
论文 或 被 引 论文 的 第 一 作者 。 但 是 ,也 有 少数 研究 由 
于 数据 限制 等 原因 ,将 两 篇 有 引用 关系 的 文献 第 一 作 
者 为 同一 人 的 现象 视 为 作者 自 引 …” 。 作 者 自 引证 
率 能 够 反映 自 引 在 知识 来 源 中 的 重要 程度 ,而 自 被 引 
率 能 反映 自 引 在 学 术 影响 力 中 的 重要 程度 。 
2.2 自 引 的 相关 因素 
经 过 文献 调研 ,本 文 发 现 作者 自 引 和 作者 自 被 引 
行为 与 以 下 因素 相关 : 


(1) 文 献 出 版 后 经 过 的 时 间 : 文 献 出 版 后 , 划 定 时 


间 窗 口 越 长 ,作者 自 被 引 数 在 作者 所 有 被 引 中 的 份额 
pe! 

(2) 学 科 : 不 同学 科 间 作者 自 引 频率 有 差异 , 例 
如 ,了 HH. Snyder FI S. Bonzi 的 研究 发 现 物理 学 科 的 作者 
自 引 率 约 为 15% ,而 社会 科学 和 人 文科 学 的 作者 自 引 
APRA 6% Fl 3% 

(3) 性 别 : 一 些 研究 发 现 , 男 性 作者 自 引 频率 高 于 
女性 ,但 是 这 种 差异 可 能 源 于 男女 生产 力 上 的 
BR 。 

(4) 作者 生产 力 / 期 刊 论文 数量 :研究 发 现 ,作者 
生产 力 与 作者 自 引 量 成 正 相 关 ” ,出 版 量 明显 增加 的 
期 刊 自 被 引 率 比较 高 ” 。 

(5) 合 著 情 况 :M. R. Davarpanah 和 下 . Amel 发 现 ， 
对 于 一 篇 文献 ,其 作者 人 数 和 文献 的 作者 自 引 证 数 成 
正 相 关 -” 。 蒋 颖 等 发 现 文献 第 一 作者 的 自 引 百分比 
都 远 高 于 其 他 作者 ,各 作者 自 引 证 数 一 般 按照 顺序 
递减 。 

(6) 被 引 数 :D. W. Aksnes 发 现 ,作者 总 被 引 数 和 
自 被 引 率 呈 现 负 相 关 关 系 ,总 被 引 数 越 大 ,作者 自 被 引 
RBR, 

作者 自 引 与 上 述 因素 存在 的 相关 关系 还 需要 更 多 
的 研究 来 验证 ,而 与 作者 自 引 相关 的 其 他 因素 还 有 待 
被 发 现 。 

2.3 自 引 对 科学 评价 的 影响 

自 引 现象 对 期 刊 影响 因子 ,学 者 h 指数 .论文 被 他 
引 数量 都 可 能 造成 影响 。 过 去 有 许多 学 者 研究 了 自 引 
对 科学 评价 指标 的 影响 ,但 由 于 数据 方法 差异 较 大 ， 
得 出 的 结论 不 尽 相 同 。 

期 刊 自 引 可 能 影响 期 刊 影响 因子 。 一 些 学 者 认为 
自 引 对 期 刊 影响 因子 有 正面 影响 ”” 。 例 如 ,A. Fas- 
soulaki 等 以 麻醉 学 领域 六 种 期 刊 中 的 文献 为 例 , 证 明 
自 引证 率 和 期 刊 影响 因子 有 显著 正 相 关 性 '” 。 然 而 ， 
一 些 研究 发 现 自 引 可 能 对 期 刊 影响 因子 没有 显著 影 
响 , 甚 至 可 能 有 负面 影响 ”” 。 例 如 ,J. M. Campanario 
Ail A. Molina 在 1998 -2006 年 JCR 中 找到 123 种 影响 
因子 连续 四 年 下 降 的 期 刊 ,发 现 自 引 行为 并 不 能 使 他 
们 的 影响 因子 明显 增加 ,因此 认为 不 能 通过 自 引 行为 
操纵 影响 因子 ” 。 还 有 一 些 研究 认为 自 引 对 期 刊 影 
响 因子 的 影响 与 期 刊 影响 力 或 年 度 等 因素 有 关 ” ” 。 

作者 自 引 可 能 对 文献 影响 力 有 影响 ,有 研究 表 
明 , 自 引 能 够 增加 被 他 引 的 数量 。J. H. Fowler 等 使 用 
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挪威 的 引文 数据 ,通过 泊 松 回归 方法 发 现 ,作者 每 增 
加 一 次 自 引 后 ,到 第 二 年 他 引 将 会 增加 大 约 1 次 ,到 
第 四 年 大 约 累计 增加 2. 83 次 ,到 第 10 年 累计 增 
加 3.65 wx", 

另外 ,作者 自 引 也 可 能 对 h 指数 及 其 排名 造成 影 
响 。 学 者 们 对 自 引 对 指数 的 影响 也 持 不 同 观点 。 浊 
分 学 者 认为 , 自 引 对 指数 的 影响 比较 小 "下 ,例如 
查 颖 以 《图 书馆 .情报 与 文献 学 学 术 影 响 力 研究 报告 
(2000 -2004)》 中 论文 被 引 次 数 排名 前 10 位 的 学 者 为 
调研 对 象 ,发 现 是 否 吻 除 自 引 对 h 指数 及 其 排名 的 影 
EU AIRA BIUS h 指数 平均 下 降 5. 6% 1 。 但 也 
有 研究 认为 自 引 会 对 h 指数 产生 较 大 影响 , 如 M. 
Schreiber 经 统计 认为 自 引 会 对 指数 产生 较 大 影响 ， 
特别 是 在 对 b 指数 较 低 的 青年 学 者 进行 科学 评价 时 应 
“ABR AGI 

人 基于 以 上 研究 ,本 文 将 针对 我 国 图 书 情报 学 领域 
插 轩 引 现象 进行 实证 研究 。 在 本 文 的 第 四 部 分 ,将 对 
自 引 与 时 间 生产 力 等 因素 的 关系 ,文献 的 作者 自 引 对 
他 天 数量 的 影响 , 自 引 对 指数 的 影响 等 重要 问题 进 
ff, 


之 从 中 国 知 网 数据 库 获 到 中 国 图 书 情报 学 领域 17 
PRAF 1955 - 2017 年 间 的 98 948 篇 文献 的 书 
目 惨 据 , 及 其 参考 文献 ( 仅 售 知 网 所 收录 的 参考 文献 ) 
AMAR 2018 年 的 引证 文献 数据 ,用 于 本 文 研究 。 这 17 
入 期 刊 是 通过 第 七 版 (中 文 核心 期 刊 要 目 总 览 )” ,与 
2017 -2018 年 版 CSSCI 来 源 期 刊 目录 交集 所 确定 的 图 
书馆 学 情报 学 领域 的 期 刊 ,涵盖 了 图 书 情报 学 领域 大 
多 数 比较 重要 的 期 刊 和 文献 。 数 据 清洗 过 程 中 ,删除 
了 出 版 年 份 信息 错误 或 缺失 、 作 者 信息 缺失 以 及 参考 
文献 数 为 0 的 25 782 篇 文献 ,剩余 发 表 于 1957 - 2017 
年 间 的 73 160 篇 文献 ,以 及 这 些 文献 的 38 556 名 作 
者 。 表 1 为 数据 集中 各 期 刊 文献 数量 。 其 中 ,发 表 文 
献 最 多 的 是 《图 书 情报 工作 》。 图 1 显示 了 文献 发 表 时 
间 分 布 , 由 于 1957 - 1990 年 文献 数量 较 少 ,在 图 1 左 
侧 另 做 展示 。 

本 文 的 研究 目标 主要 是 以 情报 学 领域 为 例 ,通过 
探索 自 引 相关 指标 的 相关 因素 以 及 自 引 与 自 被 引 行为 
对 论文 影响 力 的 影响 ,来 对 自 引 这 一 现象 有 更 透彻 的 
理解 。 本 文 提出 以 下 研究 问题 : 我 国 图 书 情报 学 的 


表 1 数据 集中 各 期 刊 刊载 文献 数量 


期 刊 名 称 文献 数量 /篇 
图 书 情报 工作 10 150 
岗 代 情 报 9 634 
情报 科学 6 586 
图 书馆 论坛 5 395 
图 书馆 建设 4 647 
情报 理论 与 实践 4 580 
到 书馆 工作 与 研究 4510 
到 书馆 理论 与 实践 4 419 
情报 杂志 3 817 
岗 代 图 书 情报 技术 3 069 
情报 资料 工作 2 739 
情报 学 报 2 618 
图 书馆 杂志 2 369 
图 书 情报 知识 2 363 
大 学 图 书馆 学 报 2 327 
图 书馆 1 990 
中 国 图 书馆 学 报 1 947 
合计 73 160 

注 :《 现 代 图 书 情报 技术 》 于 2017 年 更 名 为 《数据 分 析 与 知识 发 


现 》 
自 引水 平 如 何 ? 自 引 证 率 和 自 被 引 率 有 什么 特征 
@ 自 引 的 频次 和 比率 与 文献 出 版 后 时 间 、 作 者 生产 力 、 
作者 合作 情况 是 否 有 相关 性 ? 有 怎样 的 相关 性 ?”@@ 作 
者 自 引 对 作者 的 h 指数 及 其 排名 有 怎样 的 影响 ? OX 
献 中 的 作者 自 引 是 否 会 影响 文献 被 他 引 的 频次 ? 
基于 以 上 的 研究 问题 ,本 研究 的 数据 处 理 与 分 析 
主要 通过 Python SPSS Stata 等 工具 进行 。 在 研究 自 引 
对 文献 影响 力 的 影响 时 ,本 文采 用 负 二 项 回归 模型 。 
当 因 变量 为 计数 变量 , 即 事件 发 生 的 数目 时 ,应 考虑 使 
用 计数 模型 ,这 种 模型 适用 于 因 变 量 是 离散 的 整数 且 
数值 小 、 取 零 的 个 数 较 多 的 情况 。 计 数 模型 包括 泊 松 
回归 和 负 二 项 回归 等 模型 。 但 是 当 数据 存在 过 度 分 散 
情况 时 ,应 该 采用 负 二 项 回归 而 非 泊 松 回归 模型 。 为 
研究 自 引 现象 对 文献 被 他 引 数 量 的 影响 ,本 文 使 用 面 
板 数 据 ,将 每 篇 文献 的 被 他 引 数量 ( 即 被 引 总 数 减 去 自 
被 引 数 ) 作 为 因 变量 进行 回归 。 自 变量 以 自 引 用 数量 、 
自 被 引 数 为 核心 被 解释 变量 ,将 文献 的 引用 数量 文献 
出 版 年 份 , 作 者 平均 b 指数 .出 版 当年 期 刊 影响 因子 、 
文献 中 作者 人 数 作为 控制 变量 。 
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自 引 总 体 状 况 
ie 2 显示 了 1980 - 2017 各 年 所 发 表 文 献 平 均 自 
spex. 可 见 ,在 2000 - 2017 年 期 间 ,平均 自 引证 率 


献 自 引证 数 总 体 上 升 (2000 年 出 版 文献 平均 自 引 0. 13 
次 ,2017 年 出 版 文献 平均 自 引 0. 59 次 ) ,但 由 于 文献 
引用 数量 也 在 总 体 上 升 ,因此 自 引 证 率 变化 不 大 。 
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数据 中 73 160 篇 文献 一 共 引 用 了 430 505 次 ,其 中 
4.50% 属 于 作者 自 引 ; 这 些 文献 一 共 被 引 811 301 次 ,其 
2.97% 属于 作者 自 被 引 。 有 12 782 篇 (17.47% ) 文 献 
发 生 了 作者 自 引 ,有 13 698 篇 (18.72% ) 文献 被 作者 
自 引 。 

数据 中 的 38 556 位 作者 平均 自 引 证 率 为 1. 82% , 
作者 平均 自 被 引 率 为 2.05%。 作 者 自 引证 率 和 自 被 
引 率 的 分 布 大 致 相似 , 绝 大 多 数 作者 的 自 引证 率 或 自 
被 引 率 都 在 [0 ,10% ) ,有 少数 作者 的 自 引证 率 或 自 被 
引 率 在 [10% ,20% ) , 仅 有 2. 17% 的 作者 自 引证 率 超 
过 了 20% ,2.52% 的 作者 的 自 被 引 率 超过 了 20% 。 

4.2 作者 自 引 行为 的 相关 因素 分 析 
4.2.1 作者 自 被 引 与 文献 出 版 后 时 间 的 关系 

文献 作者 自 被 引 平均 发 生 在 文献 发 表 后 的 2. 65 

年 ( 当年 的 自 被 引 视 为 发 表 后 第 0 年 ) , 相 比 之 下 ,文献 


年 份 


2 1980 -2017 各 年 所 发 表 文 献 平均 自 引证 率 ( 不 含 零 施 引文 献 ) 


的 被 引用 平均 发 生 在 发 表 后 4.47 年 。 由 图 3(a) 可 
知 ,文献 在 发 表 后 第 一 年 自 被 引 数 达到 峰值 ,而 在 发 表 
后 2 -20 年 自 被 引 数 递减 , 自 被 引 数 也 比较 少 。 由 图 3 
(b)(c)(d) 可 见 ,对 于 被 引 量 在 不 同 程度 的 文献 , 均 显 
示 出 自 被 引 行 为 一 般 在 文献 出 版 后 更 早 发 生 的 现象 。 
4.2.2 合 著 文献 中 作者 顺序 与 作者 自 引 的 关系 

表 2 显示 了 在 有 自 引 证 行为 文献 中 不 同 顺序 作者 
的 自 引 占 比 平均 值 ,这 个 比例 是 指 不 同 顺序 作者 在 文献 
中 的 自 引证 数 与 该 文献 总 自 引 证 数 的 比值 。 在 存在 自 
引证 行为 的 文献 中 ,第 一 作者 的 自 引 占 该 文献 所 有 自 引 
的 比例 平均 为 73. 99% 。 总 体 来 看 ,文献 中 排名 越 靠 后 
的 作者 ,平均 自 引 百分比 越 低 。 对 于 各 种 合作 规模 的 文 
献 ,第 一 作者 的 自 引 占 比 平均 值 在 所 有 作者 中 都 最 高 。 
但 当 作 者 数 从 1 增加 到 8( 含 ) 以 上 时 , 随 着 作者 数量 的 
增加 ,第 一 作者 的 自 引 占 比 平均 值 不 断 下 降 。 
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一 一 一 平均 被 引 次 数 


(a) 所 有 文献 
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== ESBS ek 一 一 平均 被 3 次 数 一 平均 自 被 引 钦 数 一 一 平均 被 3 隐 数 一 一- 平均 自 被 引 次 数 一 一 平均 被 引 钦 数 
T= Sy Se peat x 
N (b) C10 为 每 年 前 1% 的 文献 (c) C10 为 每 年 前 1-10% 的 文献 (d) C10 为 每 年 前 10-50% 的 文献 
N 图 3 自 被 引 时 间 与 文献 发 表 时 间 的 时 序 分 布 
SEX C10 为 某 文献 发 表 10 年 后 的 被 引 总 数 
= 
>< #2 合 著 人 数 不 同 的 文献 中 作者 自 引 占 比 平均 值 
作者 文献 数量 不 同 顺序 作者 自 引 占 比 平均 值 /% 
数量 /人 /篇 Ist 2nd 3rd 4th 5th 6th Tth >7th 
1 5 289 100. 00 
2 4 030 61.20 38. 80 
3 2 255 51.27 27.59 21.14 
4 787 45.99 26.99 14.09 12.93 
5 242 48.02 23.35 10.46 8.81 9.36 
6 96 41.76 19.99 10.59 8.95 7.27 11.44 
7 48 36.35 20.41 8.19 14. 84 8.62 4.35 7.25 
>7 35 30. 29 10. 88 8.62 3.81 11.41 3.93 8.60 22.46 
加 权 平 均值 /% 73.99 33.20 18.19 11.60 8.97 8.07 7.82 22.46 


4.2.3 ”作者 自 引 与 生产 力 、 学 术 生 涯 长 度 、 合 作 情 况 

由 表 3 可 知 , 作 者 的 自 引 证 数 与 发 表 数 量 、 学 术 生 
涯 长 度 、 合 作 人 数 / 合 作 人 次 有 不 同 程度 的 正 相 关 性 。 
类 似 的 ,作者 自 被 引 数 也 与 上 述 因素 存在 弱 或 中 度 相 
关 性 。 因 此 ,可 以 认为 在 一 般 情 况 下 ,发 表 文献 数量 越 
多 .合作 过 的 总 人 次 越 多 、 学 术 生 涯 越 长 bh 指数 越 高 


的 作者 ,他 们 的 自 引证 数 或 自 被 引 数 也 较 高 。 男 外 ,这 
种 正 相关 性 是 有 条 件 的 , 当 将 作者 按 论 文 发 表 数 量 或 
h 指数 分 组 后 计算 变量 相关 性 发 现 ,对 于 有 一 定 生 产 
力 或 影响 力 的 作者 群体 ,能够 更 容易 观测 到 自 引 证 数 / 
自 被 引 数 与 合作 情况 .引用 数量 、 被 引 数 的 正 相 关 性 ， 
如 表 4、 表 5 结果 所 示 : 


166 


ChinaXiv 合 作 期 刊 
Aah, Ge, 步 一 .我国 图 书 情报 学 作者 自 引 行为 研究 初探 [J]. 图 书 情报 工作 ,2022,66(20) :162 -171. 


表 3 作者 自 引 情况 与 其 他 因素 的 Spearman 相关 性 分 析 


Spearman 相关 系数 自 引证 数 自 被 引 数 自 引证 率 自 被 引 率 
合作 人 次 3 .347 * .304** 4312 
合作 人 数 .304 ** 317" ee ie . 283 ** 
篇 均 合作 人 次 .042 ** . 060 ** . 039 ** . 059 ** 
篇 均 合 作 人 数 -.055 ** 一 .039 ** -.050 ** -.030** 
发 表 文 献 数 量 ATT * .484 ** 445 ** . 438 ** 
引用 数量 .405 ** .429 ** .368 ** .392 ** 
被 引 数 .375 ** .404 * .346 ** .351 ** 
被 他 引 数 .362 ** 372" 333" -316 * 
h 指数 .465 ** .479 * .432 ** .428 * 
HRA SIE h 指数 .445 ** .443 ™ 412" .387 ** 
学 术 生涯 长 度 .441 * .442 ™* .413™* .401 ** 
注 :” 在 0.01 级 别 ( 双 尾 ) ,相关 性 显著 
= 
> 表 4 按 作者 发 表 文 献 数量 分 组 的 Spearman 相关 性 分 析 
NG < 和 相关 性 (分 组 :发 表 文献 数量 se[0,3] ) 相关 性 (分 组 :发 表 文献 数量 >3) 
(ae) 自 引证 数 自 被 引 数 自 引用 率 自 被 引 率 自 引 证 数 自 被 引 数 自 引 用 率 自 被 引 率 
© 合作 人 次 .093 ** 114" 090 ** .110 * . 389 ** .405 ** . 248 ** .246 ** 
a ”合作 人 数 .075 * .094** .073** .091 ** .347 * .355 ** 211 . 203 ** 
TE 篇 均 合作 人 次 .025 ** 047 ** 024 * 046 * . 101 ** 127" 063 ** . 107 * 
GN 篇 均 合作 人 数 -0.000 .018 * -0.000 .019 ** -0.011 0. 007 -0.022 0.017 
N 发 表 数 量 .216 * .210 ** . 209 ** .201 ** . 533 ** 524 ** 357 ** . 298 ** 
= 引用 数量 . 136 * . 165 * .126** .161 ** .469 ** . 494 ** 242 313" 
二 ” 被 引 数量 .082 * .130 ** .079 * 114" 412 * .418 * . 266 ** 121" 
.之 被 他 引 数 .063 ** .073 ** . 060 ** . 056 ** . 386 ** . 384 ** . 240 ** . 083 ** 
n h 指数 174% . 186 ** . 168 ** 175 * 471 * .476 ** .313 ** .211 * 
CRA 引 后 h 指数 as 110 ** 130°" 097 ** 431 ** 425 * i273" . 153 * 
Fa 学 术 生涯 长 度 .207 ** .196 * .201 ** .189 * .270 ** .244 ** .176 ** .098 ** 


CO. 在 0.01 级 别 ( 双 尾 ) ,相关 性 显著 
R5 按 作者 h 指数 分 组 的 Spearman 相关 性 分 析 


Spearman 相关 系数 相关 性 (分 组 :h 指数 | [0,2]) 相关 性 (分 组 :h 指数 >2) 

自 引证 数 自 被 引 数 自 引用 率 自 被 引 率 自 引证 数 自 被 引 数 自 引 用 率 自 被 引 率 
合作 人 次 .090 ** „1134 087 ** . 109 ** 411 ** 421 ** . 283 ** . 282 ** 
合作 人 数 .070 * .092 ** .068 ** .089 ** .372 ** .371** .249 ** . 243 ** 

篇 均 合 作 人 次 .029 ** .050 ** .028 ** .049 ** . 106 ** . 130 ** O77 * 115 * 
篇 均 合 作 人 数 0. 003 . 020 ** 0. 003 .021 * - 0.003 0.015 -0.009 .026 * 
发 表 数量 . 202 ** . 206 ** . 195 * . 196 ** . 552 ** . 538 ** . 393 ** . 349 ** 
引用 数量 lar . 162 ** iy * . 158 ** 494 ** 513 * 292% 356 * 

被 引 数 量 .087 ** .138 * .084 ** 192° 426 ** 419 ** . 295 ** . 160 ** 

被 他 引 数 .071 * .086 ** .068 * .069 ** .399 ** . 384 ** . 269 ** . 120 ** 

h 指数 71 191 ** . 165 * 178 ** .503 ** .497 ** .354 ** 274°" 
剔除 自 引 后 h 指数 142 * pk .137** 110 * 457 ** 436 * . 308 ** .201 * 
学 术 生涯 长 度 .192 * .190 ** .187 ** .181 ** 321" . 296 ** .225 ** . 165 ** 


TE. 在 0.01 级 别 ( 双 尾 ) ,相关 性 显著 ; * . 在 0.05 级 别 ( 双 尾 ) ,相关 性 显著 
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4.3 ”作者 自 引 对 hh 指数 的 影响 

数据 显示 ,包含 自 引 时 ,作者 指数 平均 为 2.074; 
而 剔除 自 引 后 , 指数 平均 为 2. 028 。 剔 除 自 引 使 得 作 
者 的 h 指数 下 降 了 0 到 4 不 等 ,作者 指数 平均 下 降 
T 0.045 ,平均 下 降 比 例 为 1.83% 。 通 过 Wilcoxon 符 
号 秩 检验 发 现 , 含 自 引 的 h 指数 与 不 合 自 引 的 b 指数 
之 间 有 显著 差异 (p =0. 000) 。 

为 研究 图 书 情报 学 领域 中 ,影响 力 较 大 、 知 名 作者 
的 自 引 对 他 们 的 指数 及 其 排名 的 影响 ,本 文 计算 出 
被 引 数 最 高 的 前 20 位 作者 上 指数 和 被 引 数 在 剔除 自 
引 后 的 情况 ,剔除 自 引 后 ,他 们 的 h 指数 下 降幅 度 在 0 
至 6.06% 范围 内 ,有 11 位 作者 的 h 指数 在 剔除 自 引 后 
并 没有 发 后 变动。 剔除 自 引 后 ,他 们 的 h 指数 平均 下 
Kee 1.77% 5 
PRL, , RF B ERE R D EK EE 
PASE 7 BBR ABIX h 指数 的 数值 和 排名 有 一 定 程度 
PAURES AEU 
4 文献 的 作者 自 引 对 文献 被 他 引 数量 的 影响 
.一 由 于 被 他 引 数量 属于 计数 数据 ,并 且 在 一 定 程度 


í 
j 


上 呈现 过 度 分 散 的 特点 ,因此 采用 Stata 的 NB2 负 二 项 
回归 ,使 用 稳健 标准 误 。 回 归结 果 显 示 , 负 二 项 回归 
alpha 值 的 95% 置信 区 间 为 (0.90 ,0.92) ,应 拒绝 alpha 
=0 的 原 假设 ,说 明 数 据 存在 明显 的 过 度 离散 现象 , 采 
用 负 二 项 回归 比 泊 松 回归 更 加 合适 。 
回归 结果 见 表 6, 自 变量 中 除了 “作者 人 数 ” ,其 他 
回归 系数 均 显 著 。 表 6 回归 结果 的 发 生 率 比值 (inci- 
dence-rate ratios , IRR ) 形式 解释 ,IRR 表示 解释 变量 增 
加 1 时 ,被 解释 变量 的 新 的 发 生 率 与 旧 的 发 生 率 的 比 
值 的 平均 值 。 由 表 6 可 见 在 其 他 变量 相似 的 条 件 下 ， 
当 文 献 的 自 引 用 数量 增加 1 时 ,被 他 引 的 数量 平均 会 
降低 9.86% 。 当 文献 自 被 引 的 数量 增加 1 时 ,其 被 他 
引 的 数量 平均 会 增加 12.82% 。 由 此 可 见 , 当 文献 的 作 
影响 力 、 所 发 表 的 期 刊 影响 力 等 条 件 相似 的 情况 下 ， 
文献 被 作者 自 引 时 ,会 增加 其 可 见 性 ,从 而 增加 其 被 他 
人 引用 的 可 能 性 。 相 反 ,在 其 他 条 件 相似 的 情况 下 ,一 
篇 文献 的 作者 自 引 用 的 增加 ,可 能 会 因为 文献 质量 相 
对 较 低 .受到 偏见 等 原因 ,获得 更 少 的 被 引 。 


— 


= R6 负 二 项 回归 结果 
Number of obs =73 ,160 
Wald chi2(7) =7 150.97 
Dispersion = mean Prob > chi2 =0.000 0 
Log pseudolikelihood = -242 927.35 Pseudo R? =0. 028 7 
文献 被 他 引 数 量 Coef. Robust Std. Err Z P>Izl IRR 
自 引证 数量 -0. 103 8 0. 008 0 -12.92 0. 000 0.901 4 
自 被 引 数 0. 120 6 0.006 4 18.81 0. 000 1.128 2 
引用 数量 0.002 1 0.001 0 2.1 0.036 1.002 1 
J 发 表 年 份 -0.039 6 0.001 1 -36.45 0. 000 0.961 1 
平均 h 指数 0.047 1 0.001 0 44.98 0. 000 1.048 2 
当年 期 刊 影响 因子 0.285 1 0.007 0 41.01 0. 000 1.329 9 
作者 人 数 0.0147 0.005 8 2.54 0.011 1. 52E +35 
_cons 81.006 6 2.176 4 37.22 0. 000 1.52 
5 结论 18.72% KXK AI SERE 
=A 


从 分 析 结 果 来 看 ,本 文 的 结论 可 以 总 结 如 下 : 
5.1 中 国 图 书 情报 学 领域 的 自 引 行为 总 体 上 较 少 
通过 对 1955 -2017 年 间 的 73 160 篇 文献 的 分 析 ， 
得 出 我 国 图 书 情报 学 领域 作者 平均 自 引 证 率 为 
1.82% ,平均 自 被 引 率 为 2.05% 。 所 有 引用 中 4. 50% 
属于 作者 自 引 ,所 有 被 引 中 2. 97% 属于 作者 自 被 引 ， 
所 有 文献 当中 17. 47% 的 文献 发 生 了 作者 自 引 ， 


相 比 ,可 以 发 现 我 国 图 书 情报 学 领域 的 自 引水 平 相对 
较 低 ,例如 ,H. Snyder FI S. Bonzi 基于 1980 - 1989 年 来 
自 人 文 社 科 和 自然 科学 多 个 领域 的 期 刊 文献 数据 的 研 
究 发 现 总 体 9% 的 引用 为 自 引 ,其 中 社会 科学 领域 中 
约 6% 的 引文 是 自 引 " ,尽管 自 引水 平 因 学 科 、 时 间 而 
异 ,但 可 以 认为 我 国 图 书 情报 学 领域 自 引 水 平 总 体 上 
处 于 合理 范围 。 
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ALJ]. 图 书 情报 工作 ,2022 ,66(20):162 -171. 


5.2 ”作者 自 引 频次 与 其 发 表 文 献 数 量 、 合 作 总 
学 术 生 涯 长 度 有 不 同 程度 的 正 相关 
这 些 现 象 很 可 能 都 是 因为 作者 自 引 频次 与 作者 生 


Va 
Ks 


当 引 用 的 概率 也 就 更 高 ,因此 文献 整体 质量 也 有 可 能 
受 不 当 自 引 影响 而 降低 ,导致 其 被 他 引 数量 也 降低 。 


产 力 之 间 的 强 正 相 关 性 。 当 作者 生产 力 越 高 ,发 表 的 
文献 越 多 ,能够 自 引 的 机 会 也 就 越 多 ,同时 也 可 能 因 研 
究 之 间 的 延续 性 和 相关 性 而 产生 了 更 强 的 自 引 。 
此 ,不 能 以 自 引 的 绝对 频次 来 判断 作者 是 过 度 上 自 引 还 
是 适度 自 引 。 
5.3 合 著 文 献 中 作者 顺序 与 作者 自 引 相关 

对 于 各 种 合作 规模 的 文献 ,第 一 作者 在 文献 中 的 
自 引用 在 该 文献 的 所 有 自 引 用 中 的 比重 平均 值 都 是 最 
高 ,这 表明 第 一 作者 可 能 更 具有 科研 的 积累 优势 ,在 研 
究 中 承担 比较 重要 的 工作 , 而 当 合 作 规模 扩大 时 ， 
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瞧 研 究 工作 的 分 担 有 关 。 因 此 , 合 著 文献 中 自 引 比 
或 能 在 一 定 程度 上 说 明 各 作者 对 文献 的 贡献 程度 。 
MO 文献 被 作者 自 引 与 该 文献 出 版 后 时 间 相关 

一 文献 的 自 被 引 平均 发 生 在 文献 发 表 后 的 2. 65 年 
(当年 的 自 被 引 视 为 发 表 后 0 年 )。 总 体 上 看 ,文献 在 
发 天 后 第 2 年 自 被 引 数 达 到 高 峰 ,而 这 以 后 的 自 被 引 
数 沈 浙 降低 。 因 此 ,从 文献 出 版 到 文献 自 被 引 经 历 的 
时 间 间 隔 总 体 较 短 的 这 一 现象 ,可 以 推测 我 国 图 书 情 
报 营 领域 自 引 行为 较 大 程度 上 与 研究 之 间 的 继承 性 和 
HRA. 

5. 人 作者 自 引 对 指数 数值 以 及 排名 有 一 定 影响 ,但 
GH UB) 

名 对 于 数据 中 所 有 作者 而 言 ,剔除 自 引 后 作者 指 
数 平均 下 降 比 例 为 1. 83% 。 对 于 中 国 图 书 情报 学 领 
域 被 引 数 排名 前 20 的 作者 而 言 , 别 除 自 引 使 其 ] 指数 
平均 下 降 了 1.77% ,其 中 部 分 学 者 的 指数 排名 有 小 
由 变动 。 因 此 ,无 论 是 对 我 国 图 书 情报 学 领域 的 高 影 
响 力 作者 群体 ,还 是 范围 更 大 的 普通 作者 群体 ,可 以 认 
为 在 该 领域 自 引 对 指数 的 影响 比较 小 。 

5.6 ”对 于 文献 而 言 , 作 者 自 引用 以 及 自 被 引 会 对 文献 
的 被 他 引 频 次 造成 影响 

在 文献 作者 数量 .所 发 表 期 刊 当年 影响 因子 作者 
PH h 指数 发 表 时 间 等 因素 受 控制 的 条 件 下 , 当 文献 
的 自 引用 数量 增加 1 时 ,被 他 引 的 数量 平均 会 降低 
9.86% ; 当 文献 自 被 引 数 增加 1 时 ,其 被 他 引 的 数量 平 
均 会 增加 12.82% 。 由 此 推测 ,文献 的 自 引用 数量 增加 
时 ,由 于 自 引 相 比 其 他 引用 的 动机 更 为 多 样 , 自 引 为 不 


而 当 文 献 自 被 引 时 ,该 文献 的 可 见 性 和 影响 力 便 会 增 
加 ,使 得 其 他 研究 者 更 容易 注意 到 该 文献 ,因此 该 文献 
被 他 引 的 数量 也 更 可 能 增加 。 

综 上 所 述 ,在 我 国 图 书 情报 学 领域 ,作者 自 引 的 现 
象 并 不 十 分 常见 ,过 度 自 引 的 现象 很 可 能 更 为 罕见 ,并 
且 因 作者 自 引 对 b 指数 产生 的 影响 可 能 也 比较 小 。 作 
者 自 引 对 文献 被 他 引 频 次 的 影响 是 客观 存在 的 ,但 这 
很 可 能 也 跟 文献 自身 质量 水 平 相关 。 

总 的 来 说 ,虽然 目前 已 有 一 些 识别 过 度 自 引 或 将 
自 引 适 度 纳 入 科学 评价 的 方法 “” ,但 在 科学 评价 实 
践 中 类 似 的 方法 并 未 得 到 推广 ,也 难以 证 实 哪 种 方法 
是 比较 科学 、 公 人 允 。 从 本 文 的 研究 来 看 , 自 引 与 发 表 文 
献 数量 等 众多 因素 相关 ,而 自 引 行 为 对 bh 指数 及 其 排 
名 有 一 定 影响 ,但 总 体 影 响 较 小 ,因此 ,更 应 该 反对 简 
单 地 在 科学 评价 中 删除 自 引 的 方法 。 而 寻找 科学 处 理 
自 引 的 方法 ,还 需要 基于 自 引 相关 规律 的 后 续 研究 和 
验证 。 未 来 ,笔者 认为 自 引 的 研究 和 处 理应 该 向 论文 
全 文本 分 析 、 自 引 功 能 判断 等 方面 发 展 ,通过 引文 功能 
判断 .引文 动机 判断 等 智能 化 识别 自 引 行为 的 合理 性 。 
由 于 时 间 与 技术 等 原因 ,本 研究 还 存在 诸多 的 不 足 之 
处 ,包括 数据 覆盖 不 够 全 面 结论 局 限 在 图 书 情报 学 领 


域 等 问题 ,在 未 来 的 研究 中 可 以 进一步 改进 。 
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A Preliminary Study on Author Self-Citation Behaviors in Library and 
Information Science in China 
Li Xinyu Lei Jiaqi Bu Yi 

Department of Information Management, Peking University, Beijing 100871 
Abstract: | Purpose/Significance | Author self-citations are a common phenomenon and an important factor to 
be considered in citation analysis and scientific evaluation. However, how to deal with author self-citations in scien- 
tific evaluation has always been controversial. This paper expects to provide suggestions for proper treatment of author 
self-citations by exploring the principles of author self-citations. | Method/Process | Based on a thorough survey on 
previous works related to author self-citations, this paper adopted the journal data of library and information science 
(Chinese literature) and implemented author- and paper-level analyses of author self-citations by using statistical 
methods such as regression analysis. | Result/Conclusion | Empirical results show that Chinese library and informa- 
tion science researchers tend to have a low rate of author self-citations and that there is a strong positive correlation 
“between the author self-citation frequency and the number of published articles. The paper also observes that author 
Gélf-citations have limited impact on h-index and that being self-cited may boost the possibility of citations (by oth- 
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